通过论文的数据来源部分发现数据,以淘宝村数据为例
最近,我在随便翻阅地理科学期刊官网的时候,看到了这样一篇论文《基于格网的淘宝村集聚特征及影响因素分析》,感觉数据会很有意思,因此只看了它的数据来源部分。通常来说,一般人应该会格外关注论文的方法,而我只会关注数据来源部分。
除了淘宝村数据外,其他数据我们或多或少都知道来源,道路数据和基础地理数据来自全国地理信息资源目录服务系统http://mulu.tianditu.gov.cn/main.do?method=index
POI数据只能通过地图api获得最新的数据。而GDP和人口格网数据在中科院资环数据中心需要手机号注册下载,建议使用全球变化科学研究数据出版系统,可以直接下载
http://www.geodoi.ac.cn/WebCn/Default.aspx
http://www.geodoi.ac.cn/WebCn/doi.aspx?Id=125
中国公里网格GDP分布数据集
http://www.geodoi.ac.cn/WebCn/doi.aspx?Id=131
中国公里网格人口分布数据集
接下来是重头戏,也是本文的重点,淘宝村数据的获取。论文中说数据来自阿里研究院-淘宝村,搜索一下,知道网址了。
http://www.aliresearch.com/cn/activity/taobaoVillage
文中的方法,是通过先获得淘宝村的名单,然后地理编码获得坐标。而我通过观察网站,看到这么一个地图,发现也可以这样做。作为一个人研究素材,让我们F12看一眼,我本身不会爬虫,这里也不做深究,只是说明通过看文献的数据来源部分可以为我们找数据提供方便。
F12的具体用法可以参照我之前的文章《浏览器F12的用法》。
我尝试了论文的方法,找到了2016年的淘宝村报告
pdf的表格转成真实表格,通过地理编码获取坐标。通过pdf和地图数据,这样就能获得2016年和2019年两期数据了。授人鱼不如授人以渔,我在这里就不亲自获取这些数据了,你可以认为我懒,当然了你也可以认为我根本就不会。我只是提供了一种方法,一种解决你找不到数据的方法而已。我之前也提到过两种方法。《经验分享|如何寻找GIS数据?》《没有数据怎么办?建议自己做一个》
除此之外,我还分享了以下数据集,欢迎大家分享和推荐。